Rząd opiera swoje analizy na hobby nastolatka? Ekspert dementuje
W czwartek serwis Komputer Świat opisał sprawę nastolatka, Michała Rogalskiego z Torunia, który opracował bazę danych na temat przebiegu pandemii w Polsce, korzystając z różnych, rozproszonych, publicznych źródeł (od komunikatów Ministerstwa Zdrowia po informacje powiatowych stacji sanitarno-epidemiologicznych).
Z zasobu tego korzysta m.in. jedna z grup naukowców, która modeluje przebieg pandemii w Polsce. Zasugerowano, że oznacza to, że w pewnym stopniu działania związane z pandemią w Polsce zależą od hobby jednego internauty.
– Sugerowanie, że poprzez opracowany zbiór rozproszonych, publicznych danych na temat przebiegu pandemii w Polsce pan Rogalski wpływa na decyzje rządu o restrykcjach sanitarnych jest przesadą. Rząd przecież ma te dane w systemach obsługujących szpitale, POZ-ety, stacje sanitarno-epidemiologiczne czy wreszcie laboratoria wykonujące testy na COVID-19. W ramach MZ dochodzi do synchronizacji i integracji tych danych, w cyklach dobowych, dzięki czemu codziennie polska opinia publiczna otrzymuje aktualne informacje na temat stanu pandemii w Polsce – skomentował dla PAP kierownik Laboratorium Badań Medioznawczych Uniwersytetu Warszawskiego dr hab. Tomasz Gackowski.
Dodał, że nie oznacza to wcale, że polskie władze bez jego pracy nie są w stanie monitorować skali zagrożenia koronawirusem.
– Zasługą pana Rogalskiego jest to, że skutecznie identyfikuje te publiczne źródła informacji, część z nich wydobywa – przy wsparciu zespołu BIQ Data Gazety Wyborczej – w ramach trybu informacji publicznej od np. powiatowych stacji sanitarno-epidemiologicznych, które są w wielu wypadkach spóźnione z upublicznianiem tego typu danych – oraz regularnie je monitoruje, a same dane strukturyzuje w jednorodny zbiór, który następnie może podlegać atrakcyjnej obróbce wizualnej – prezentacji wykresów, tabel, krzywych etc. – dodał Gackowski.
– Resort zdrowia ma różne dane i dzieli się częścią z nich raz na dzień. Wie dokładnie, jaka jest aktualna sytuacja w kraju – przypomina Gackowski.
Podkreśla, że informacje te pochodzą z różnych baz danych, m.in. sanepidów, szpitali czy POZ i nie zawsze są ze sobą dynamicznie synchronizowane. Zwraca uwagę na problem stacji sanitarno-epidemiologicznych, które ze względu na nawał pracy nie zawsze są w stanie raportować na bieżąco, stąd czasem mogą wynikać trudności związane z upublicznianiem takich informacji.
Gackowski wysoko ocenia wkład Rogalskiego, który polega na zebraniu i usystematyzowaniu danych o COVID-19 w Polsce. Zaznacza, że takie działanie nie jest odosobnione. Na przykład w początkach pandemii w Korei Południowej w wizualizacji zakażeń na potrzeby rządu również pomógł genialny nastolatek Lee Jun-young, który stworzył aplikację "Coronamap".
– A pamiętajmy, że kraj ten jest od naszego wielokrotnie lepiej scyfryzowany. Mimo to chętnie skorzystano z pomocy młodego programisty, który teraz traktowany jest jako bohater narodowy – dodał.
Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego (ICM) Uniwersytetu Warszawskiego informuje na swojej stronie, że prognozy z rozwoju epidemii COVID-19 są oparte na danych Ministerstwa Zdrowia, pobranych z agregowanego i ustrukturyzowanego zbioru publicznie dostępnych danych, przygotowanego przez Michała Rogalskiego. W ocenie Gackowskiego najlepiej by było, gdyby twórcy prognozy i modeli weryfikowali te dane "na wejściu" i samodzielnie je monitorowali.
– Każdy twórca modelu chce mieć pewność danych na wejściu i na wyjściu. Tutaj najprawdopodobniej ICM ufa danym Rogalskiego, bo sprawdzają się w dłuższym horyzoncie czasowym, a jego praca ułatwia ich analizy – zaznacza.
Podkreśla, że model ten tylko częściowo oparty jest na danych o przebiegu pandemii. Inne jego elementy dotyczą np. zagęszczenia ludności w szkołach, w komunikacji miejskiej i innych czynników, których charakter i waga w modelu jest już autorskim rozwiązaniem badaczy z UW.
Ekspert mówi, że resorty powinny dążyć do ujednolicania i strukturyzowania swoich danych i udostępniani do nich "gotowych wtyczek" (API).
– To jest ideał, do którego powinniśmy dążyć, bo ciągle odczuwamy deficyt dostępu do danych publicznych. Jednak podobna sytuacja jest w wielu innych krajach. Polska nie jest wyjątkiem. Spójrzmy, w jaki sposób udostępniane są dane we Włoszech, w Niemczech, we Francji. Tam także wiele jest do zrobienia. Pewne jest jedno – te dane są, są one publiczne, ale są rozproszone i nie każdy byłby je w stanie zlokalizować, zebrać i opracować – powiedział.
W ocenie Gackowskiego postulat powstania centralnej jednostki, która podjęłaby się trudu zbierania w jednym miejscu i udostępniana danych nowoczesnego cyfrowego państwa jest warta rozważenia.
Ministerstwo Zdrowia korzysta z kilku modeli rozwoju epidemii COVID-19 w Polsce, przygotowanych przez polskich naukowców. Oprócz ICM UW są to zespół prof. Tylla Krügera z Politechniki Wrocławskiej i zespół z Wydziału Matematyki Informatyki i Mechaniki Uniwersytetu Warszawskiego, a także NIZP-PZH – wynika z informacji uzyskanych przez PAP w czerwcu.